#-*- codeing = utf-8 -*-
#@Time : 2020/10/30 15:15
#@Author : 阳某
#@File : 07.Python绘制箱形图分析北京数据.py
#@Software : PyCharm

'''
箱形图
箱形图（Box-plot）又称为盒须图、盒式图或箱线图，是一种用作显示一组数据分散情况的统计图。

箱形图的图形组成
对于一组数字，先将其从小到达排列，然后计算图中元素：
箱形图的价值
直观明了地识别数据中的异常值
利用箱线图判断数据的偏态和尾重
利用箱线图比较几批数据的形状
'''
import pandas as pd
import seaborn as sns
sns.set(style="whitegrid")
sns.set(rc={'figure.figsize':(11.7,8.27)})

# 实例目标：对比北京2019年天气数据中，4个季度的温度分布对比
df = pd.read_csv("./datas/beijing_tianqi/beijing_tianqi_2019.csv")
print(df.head(3))

#2. 把温度列从字符串变成数字
# 把最高温度列，从2℃的形式，变成数字
df['bWendu'] = df['bWendu'].str.replace("℃", "").astype(float)
print(df.info())

# 根据天日期添加季度数字列
# 获取季度数字
df["quarter"] = pd.to_datetime(df["ymd"]).dt
df["quarter"] = pd.to_datetime(df["ymd"]).dt.quarter
print(df.head(6))
# 4. 调用seaborn绘制boxplot
ax = sns.boxplot(x='quarter',y='bWendu',data=df)


